雑談 2026年1月
2026/1/31
大事な気がするのでしっかり読みたいnomadoor.icon
2026/1/29
RAM 96GBの民になりました。破産です。nomadoor.icon
お大事に…morisoba65536.icon
現在「世界モデル」とか言ってお出しされる生成AI(操作可能なもの)、少なくとも見てる範囲のものは全部拡散モデルベース動画の延長線なので流石に世界モデルは盛りすぎ感が強い…(Sora2クラスでも拡散モデルのビッグデータゴリ押しではピタゴラスイッチを作れないんで…)morisoba65536.icon
WAKARUnomadoor.icon
キーボード操作条件付きリアルタイム動画生成くらいにしておかないと本当の世界モデルが出てきた時困りそう
2026/1/28
CFG1はステップ数さえ適切なら普通に通るので時短生成したいときには1でネガティブスキップはできる
CFG1は流石にちょっと不安定だった
ものすごい難しいなこのモデル…nomadoor.icon
適当に使えない感じPony V7みたいだ
ちょこちょこ大きなものがあった気がするけれど(´ε` )
2026/1/27
↑ComfyUIのワークフローが準備されたり、開発の中の人と知り合いと思われるアカウントが今日リリースと書いてるんだけどちょっと戸惑い出してるのでなんかアップロードとかに問題起きてるのかな…となりつつあるmorisoba65536.icon 👏nomadoor.icon
2026/1/26
直接的にワークフローが張っているわけではないようだmorisoba65536.icon
FLUX.2-klein-4Bのmultiリファレンスで漫画の一コマをキャラデザイン維持して作れたのでコマごとにキャラが変わる問題はローカルのみでも割と解決できるフェーズに入ったかもしれない(ただし結構ガチャは必要)morisoba65536.icon 2026/1/23
すごいnomadoor.icon
流石に2人じゃ厳しいとは書いてあるけど、GPU回せるだけの資金があれば人数じゃないんだなぁ…
蒸留モデル - 蒸留LoRA って、dev + 蒸留LoRAと比べると損しかしてないような気がするけどどうなんですかね…nomadoor.icon
普通に考えるとそうなんだけど、蒸留モデルで過学習気味になっている画質向上の処理を弱体化させることでちょうどよくなったのかもしれない(汎用的なものかピンポイントな状況で刺さったのかは不明)morisoba65536.icon
2026/1/22
2026/1/21
2026/1/20
Redditでのモデルの話題性を見てるとモデル自体の大きさに加えて「生成までの速度」も結構大きな要素になってそうな感じはあるmorisoba65536.icon
画像生成でこういうのやりたい基素.icon
https://youtu.be/nD07fRbAs5U
Wan-Animateが出たときにやろうと思ったけど、時間がかかりすぎるのでやめた…nomadoor.icon https://www.youtube.com/watch?v=oMFnxahh-WM
こんな感じでもっとアニメに寄せようと思ってた
速度的にはLTX-2は評判良さそうなので2.1辺りなりLoRAなりで画質のドリフトが落ち着いてくれば行けるのかもしれないmorisoba65536.icon
2026/1/19
2026/1/18
かなりすごいnomadoor.icon
2026/1/16
軽くアーキテクチャを調べた限りGLM-Imageはかなり(これまでの生成モデルと)画像生成のアーキテクチャが違いそう。具体的には今までのモデルが「llmが埋め込みと言う設計図生成→現場は拡散モデルが仕様をもとに組み立てる」だったのがGLM-Imageは「設計者(LLM)が現場まで来て区画単位で作業指示する」ような形morisoba65536.icon 要は従来モデルのパイプラインをそのまま使えないのでComfyUI対応はもしするとしたら大工事になるだろうなと…(このタイプのアーキテクチャが流行りそうになければちと実装されるかも怪しそう)morisoba65536.icon 周辺の報告や挙動等からすると恐らくgpt-image-1等はこれに近い仕組みと思われるmorisoba65536.icon 同じように自己回帰llm+拡散モデルの組み合わせも従来の殆どのモデル(FLUX.1やQwen-Image等)は単純に埋め込み(設計図)を作るのがClipからllmに変わっただけで基本的な構造はStable Diffusionの頃から変わっていないので(なのでノードの組み合わせが基本的に流用できたようで)morisoba65536.icon 2026/1/15
あんまり変わらなかったんだけどなんでだろ…nomadoor.icon
どちらにせよ、蒸留が強いのでloraで適用したほうが綺麗に生成できる
ゆっくりいじりたいのだが色々年始の作業が詰まっていて遊べるのは今月末くらいになりそうだ…morisoba65536.icon
2026/1/13
ビミョウ…nomadoor.icon
微妙だったか…morisoba65536.icon
メモリに5万払うなら15万で3090買ってしまおうかという葛藤と戦っている…nomadoor.icon
2026/1/11
res_2sをちょくちょくオススメされるが、イマイチ良さがわからないnomadoor.icon いや、ちゃんと調べるか
もうなんでもよくない…?
ここ以下2026/01/13追記:上記リポジトリにはプロンプトの書き方ガイドなども書いてある
本家より低ランク化したdistilled loraがあるので容量減らしたい場合には有用かも?
2026/01/10
2026/01/09
ああ、このカスタムノードはI2Vの延長的な実装か
2026/01/08
もはや手遅れだけとメモリ買っとかないとさらに後悔する気がしなくもないnomadoor.icon
買うなら今すぐ、待ちなら最低2年と言った感じですね…(最長はわからん、速度妥協できるならDDR4のほうがまだマシらしい)morisoba65536.icon
🦊RunPodとかはかなり安いらしいのでそちらを軸にしていくのも手かも知れないmorisoba65536.icon 2026/01/07
小型モデルの性能向上は結構著しいので昨今のメモリ高騰が無ければ今年にはスマホで実用的なLLMが動く…もあり得そうだったんですがね…(今年はメモリ4GBスマホが復活してしまうという話もある程度なので…)morisoba65536.icon
2026/01/06
音声生成絡むから仕方ないんだろうけど…ComfyUIといえどさすがに細かいぜこれは(;・∀・)
いや、よく見たらSDXLみたいに、二段階にしてるだけか
正直「11月下旬」から「(2025)今年後半には」に変わったあたりでもうでないかなーと思ってたし一応待ったが12月中に来なかったので無いものと思ってたのでちょっとびっくりしてるmorisoba65536.icon
LTX-2.5が出来たのかな()nomadoor.icon
2026/01/05
多分そのうちDoomも動く(しらんけど)morisoba65536.icon
もうあった気がすると思ったらあったnomadoor.icon
もうあるのか…morisoba65536.icon
プロンプトの言語に出力が大きく引っ張られるのネタを見て「ヒエログリフでプロンプト書けば古代エジプト風になるかな?」と思ったがGrok曰く「現在の言葉をそのまま古代エジプト語に変換するのは難しい(表音文字として音を合わせるくらいしかできん)」と翻訳時点でストップがかかったmorisoba65536.icon 2026/01/01
2ヶ月ほど離れててすっかり浦島(まだ足軸はゲーム側)morisoba65536.icon
あけましておめでとうございます!!nomadoor.icon
https://gyazo.com/f131b84bf16077bc573865661090430c
おめー基素.icon
おうまさん!takker.icon